home *** CD-ROM | disk | FTP | other *** search
/ Personal Computer World 2009 February / PCWFEB09.iso / Software / Linux / Kubuntu 8.10 / kubuntu-8.10-desktop-i386.iso / casper / filesystem.squashfs / usr / bin / lwp-download < prev    next >
Text File  |  2008-05-03  |  8KB  |  333 lines

  1. #!/usr/bin/perl -w
  2.  
  3. eval 'exec /usr/bin/perl -w -S $0 ${1+"$@"}'
  4.     if 0; # not running under some shell
  5.  
  6. =head1 NAME
  7.  
  8. lwp-download - Fetch large files from the web
  9.  
  10. =head1 SYNOPSIS
  11.  
  12. B<lwp-download> [B<-a>] <I<url>> [<I<local path>>]
  13.  
  14. =head1 DESCRIPTION
  15.  
  16. The B<lwp-download> program will save the file at I<url> to a local
  17. file.
  18.  
  19. If I<local path> is not specified, then the current directory is
  20. assumed.
  21.  
  22. If I<local path> is a directory, then the basename of the file to save
  23. is picked up from the Content-Disposition header or the URL of the
  24. response.  If the file already exists, then B<lwp-download> will
  25. prompt before it overwrites and will fail if its standard input is not
  26. a terminal.  This form of invocation will also fail is no acceptable
  27. filename can be derived from the sources mentioned above.
  28.  
  29. If I<local path> is not a directory, then it is simply used as the
  30. path to save into.
  31.  
  32. The I<lwp-download> program is implemented using the I<libwww-perl>
  33. library.  It is better suited to down load big files than the
  34. I<lwp-request> program because it does not store the file in memory.
  35. Another benefit is that it will keep you updated about its progress
  36. and that you don't have much options to worry about.
  37.  
  38. Use the C<-a> option to save the file in text (ascii) mode.  Might
  39. make a difference on dosish systems.
  40.  
  41. =head1 EXAMPLE
  42.  
  43. Fetch the newest and greatest perl version:
  44.  
  45.  $ lwp-download http://www.perl.com/CPAN/src/latest.tar.gz
  46.  Saving to 'latest.tar.gz'...
  47.  11.4 MB received in 8 seconds (1.43 MB/sec)
  48.  
  49. =head1 AUTHOR
  50.  
  51. Gisle Aas <gisle@aas.no>
  52.  
  53. =cut
  54.  
  55. #' get emacs out of quote mode
  56.  
  57. use strict;
  58.  
  59. use LWP::UserAgent ();
  60. use LWP::MediaTypes qw(guess_media_type media_suffix);
  61. use URI ();
  62. use HTTP::Date ();
  63.  
  64. my $progname = $0;
  65. $progname =~ s,.*/,,;    # only basename left in progname
  66. $progname =~ s,.*\\,, if $^O eq "MSWin32";
  67. $progname =~ s/\.\w*$//; # strip extension if any
  68.  
  69. #parse option
  70. use Getopt::Std;
  71. my %opt;
  72. unless (getopts('a', \%opt)) {
  73.     usage();
  74. }
  75.  
  76. my $url = URI->new(shift || usage());
  77. my $argfile = shift;
  78. usage() if defined($argfile) && !length($argfile);
  79. my $VERSION = "5.810";
  80.  
  81. my $ua = LWP::UserAgent->new(
  82.    agent => "lwp-download/$VERSION ",
  83.    keep_alive => 1,
  84.    env_proxy => 1,
  85. );
  86.  
  87. my $file;      # name of file we download into
  88. my $length;    # total number of bytes to download
  89. my $flength;   # formatted length
  90. my $size = 0;  # number of bytes received
  91. my $start_t;   # start time of download
  92. my $last_dur;  # time of last callback
  93.  
  94. my $shown = 0; # have we called the show() function yet
  95.  
  96. $SIG{INT} = sub { die "Interrupted\n"; };
  97.  
  98. $| = 1;  # autoflush
  99.  
  100. my $res = $ua->request(HTTP::Request->new(GET => $url),
  101.   sub {
  102.       unless(defined $file) {
  103.       my $res = $_[1];
  104.  
  105.       my $directory;
  106.       if (defined $argfile && -d $argfile) {
  107.           ($directory, $argfile) = ($argfile, undef);
  108.       }
  109.  
  110.       unless (defined $argfile) {
  111.           # must find a suitable name to use.  First thing
  112.           # to do is to look for the "Content-Disposition"
  113.           # header defined by RFC1806.  This is also supported
  114.           # by Netscape
  115.           my $cd = $res->header("Content-Disposition");
  116.           if ($cd && $cd =~ /\bfilename\s*=\s*(\S+)/) {
  117.           $file = $1;
  118.           $file =~ s/;$//;
  119.           $file =~ s/^([\"\'])(.*)\1$/$2/;
  120.           $file =~ s,.*[\\/],,;  # basename
  121.           }
  122.  
  123.           # if this fails we try to make something from the URL
  124.           unless ($file) {
  125.           my $req = $res->request;  # now always there
  126.           my $rurl = $req ? $req->url : $url;
  127.  
  128.           $file = ($rurl->path_segments)[-1];
  129.           if (!defined($file) || !length($file)) {
  130.               $file = "index";
  131.               my $suffix = media_suffix($res->content_type);
  132.               $file .= ".$suffix" if $suffix;
  133.           }
  134.           elsif ($rurl->scheme eq 'ftp' ||
  135.                $file =~ /\.t[bg]z$/   ||
  136.                $file =~ /\.tar(\.(Z|gz|bz2?))?$/
  137.               ) {
  138.               # leave the filename as it was
  139.           }
  140.           else {
  141.               my $ct = guess_media_type($file);
  142.               unless ($ct eq $res->content_type) {
  143.               # need a better suffix for this type
  144.               my $suffix = media_suffix($res->content_type);
  145.               $file .= ".$suffix" if $suffix;
  146.               }
  147.           }
  148.           }
  149.  
  150.           # validate that we don't have a harmful filename now.  The server
  151.           # might try to trick us into doing something bad.
  152.           if (!length($file) ||
  153.                   $file =~ s/([^a-zA-Z0-9_\.\-\+\~])/sprintf "\\x%02x", ord($1)/ge)
  154.               {
  155.           die "Will not save <$url> as \"$file\".\nPlease override file name on the command line.\n";
  156.           }
  157.  
  158.           if (defined $directory) {
  159.               require File::Spec;
  160.               $file = File::Spec->catfile($directory, $file);
  161.           }
  162.  
  163.           # Check if the file is already present
  164.           if (-l $file) {
  165.           die "Will not save <$url> to link \"$file\".\nPlease override file name on the command line.\n";
  166.           }
  167.           elsif (-f _) {
  168.           die "Will not save <$url> as \"$file\" without verification.\nEither run from terminal or override file name on the command line.\n"
  169.               unless -t;
  170.           $shown = 1;
  171.           print "Overwrite $file? [y] ";
  172.           my $ans = <STDIN>;
  173.           unless (defined($ans) && $ans =~ /^y?\n/) {
  174.               if (defined $ans) {
  175.               print "Ok, aborting.\n";
  176.               }
  177.               else {
  178.               print "\nAborting.\n";
  179.               }
  180.               exit 1;
  181.           }
  182.           $shown = 0;
  183.           }
  184.           elsif (-e _) {
  185.           die "Will not save <$url> as \"$file\".  Path exists.\n";
  186.           }
  187.           else {
  188.           print "Saving to '$file'...\n";
  189.           }
  190.       }
  191.       else {
  192.           $file = $argfile;
  193.       }
  194.       open(FILE, ">$file") || die "Can't open $file: $!\n";
  195.           binmode FILE unless $opt{a};
  196.       $length = $res->content_length;
  197.       $flength = fbytes($length) if defined $length;
  198.       $start_t = time;
  199.       $last_dur = 0;
  200.       }
  201.  
  202.       print FILE $_[0] or die "Can't write to $file: $!\n";
  203.       $size += length($_[0]);
  204.  
  205.       if (defined $length) {
  206.       my $dur  = time - $start_t;
  207.       if ($dur != $last_dur) {  # don't update too often
  208.           $last_dur = $dur;
  209.           my $perc = $size / $length;
  210.           my $speed;
  211.           $speed = fbytes($size/$dur) . "/sec" if $dur > 3;
  212.           my $secs_left = fduration($dur/$perc - $dur);
  213.           $perc = int($perc*100);
  214.           my $show = "$perc% of $flength";
  215.           $show .= " (at $speed, $secs_left remaining)" if $speed;
  216.           show($show, 1);
  217.       }
  218.       }
  219.       else {
  220.       show( fbytes($size) . " received");
  221.       }
  222.   }
  223. );
  224.  
  225. if (fileno(FILE)) {
  226.     close(FILE) || die "Can't write to $file: $!\n";
  227.  
  228.     show("");  # clear text
  229.     print "\r";
  230.     print fbytes($size);
  231.     print " of ", fbytes($length) if defined($length) && $length != $size;
  232.     print " received";
  233.     my $dur = time - $start_t;
  234.     if ($dur) {
  235.     my $speed = fbytes($size/$dur) . "/sec";
  236.     print " in ", fduration($dur), " ($speed)";
  237.     }
  238.     print "\n";
  239.  
  240.     if (my $mtime = $res->last_modified) {
  241.     utime time, $mtime, $file;
  242.     }
  243.  
  244.     if ($res->header("X-Died") || !$res->is_success) {
  245.     if (my $died = $res->header("X-Died")) {
  246.         print "$died\n";
  247.     }
  248.     if (-t) {
  249.         print "Transfer aborted.  Delete $file? [n] ";
  250.         my $ans = <STDIN>;
  251.         if (defined($ans) && $ans =~ /^y\n/) {
  252.         unlink($file) && print "Deleted.\n";
  253.         }
  254.         elsif ($length > $size) {
  255.         print "Truncated file kept: ", fbytes($length - $size), " missing\n";
  256.         }
  257.         else {
  258.         print "File kept.\n";
  259.         }
  260.             exit 1;
  261.     }
  262.     else {
  263.         print "Transfer aborted, $file kept\n";
  264.     }
  265.     }
  266.     exit 0;
  267. }
  268.  
  269. # Did not manage to create any file
  270. print "\n" if $shown;
  271. if (my $xdied = $res->header("X-Died")) {
  272.     print "$progname: Aborted\n$xdied\n";
  273. }
  274. else {
  275.     print "$progname: ", $res->status_line, "\n";
  276. }
  277. exit 1;
  278.  
  279.  
  280. sub fbytes
  281. {
  282.     my $n = int(shift);
  283.     if ($n >= 1024 * 1024) {
  284.     return sprintf "%.3g MB", $n / (1024.0 * 1024);
  285.     }
  286.     elsif ($n >= 1024) {
  287.     return sprintf "%.3g KB", $n / 1024.0;
  288.     }
  289.     else {
  290.     return "$n bytes";
  291.     }
  292. }
  293.  
  294. sub fduration
  295. {
  296.     use integer;
  297.     my $secs = int(shift);
  298.     my $hours = $secs / (60*60);
  299.     $secs -= $hours * 60*60;
  300.     my $mins = $secs / 60;
  301.     $secs %= 60;
  302.     if ($hours) {
  303.     return "$hours hours $mins minutes";
  304.     }
  305.     elsif ($mins >= 2) {
  306.     return "$mins minutes";
  307.     }
  308.     else {
  309.     $secs += $mins * 60;
  310.     return "$secs seconds";
  311.     }
  312. }
  313.  
  314.  
  315. BEGIN {
  316.     my @ani = qw(- \ | /);
  317.     my $ani = 0;
  318.  
  319.     sub show
  320.     {
  321.         my($mess, $show_ani) = @_;
  322.         print "\r$mess" . (" " x (75 - length $mess));
  323.     print $show_ani ? "$ani[$ani++]\b" : " ";
  324.         $ani %= @ani;
  325.         $shown++;
  326.     }
  327. }
  328.  
  329. sub usage
  330. {
  331.     die "Usage: $progname [-a] <url> [<lpath>]\n";
  332. }
  333.